Citation :
Une méthode d'apprentissage pendant laquelle tu gaves ton IA de données et tu l'apprends de manière supervisée ou pas à reconnaitre des patterns jusqu'à ce qu'elles se trompent moins qu'un humain, voir qu'elle se trompe quasi jamais
En fait ça ça fonctionne uniquement si tu e capable de paramétrer des matrices de récompenses.
Sinon ton algo ne va pas du tout faire ce qu'il est censé faire. Les datas, elles font pas tout. Dans l'apprentissage artificielle il faut être capable de donner un objectif clair et précis (qui est toujours plus compliqué qu'un résultat. L'exemple marrant c'est des robots qui vont te dire j'arrive à marcher, mais qui vont le faire dans des configuration ou : ils sont instables et où les bras sont dans des positions qui font que physiquement cela est impossible à atteindre)
Faut vachement relativiser la puissance du Qlearning en l'état. Sans l'humain derrière elle fait R. Parceque analyser c'est bien mais c'est pas ce qui est recherché dans le Qlearning.
Ce que tu recherches, en gros, c'est comment obtenir tel résultat et après tu laisses la machine généré des boucles jusque à ce qu'elle obtienne le résultat voulu. Mais pour ça faut être capable de décrire le résultat voulu de manière très précise (sans jamais exclure des configuration/résultat qui semblent aberrants mais en essayant quand même d'être réaliste)
Enfin oui c'est nettement plus compliqué que ce que tu expliques et même assez éloigné de facto. Enfin dans l'état des connaissances au moment où j'ai stop tout ce qui était robotique.